会议日程|第十一届全国文字与计算学术研讨会(NSCC 2021)
【会议简介】
文字是人类记录、传播与获取信息的重要载体,文字对促进人类进步与社会发展起到了极其重要的作用。进入信息化时代以来,文字与计算变得愈加密不可分,并因此产生了诸多学术研究与实际应用问题,引起了学术界与工业界的广泛关注。文字计算作为一个交叉研究领域,涉及科学、技术、人文和艺术等学科。为给国内外从事文字与计算相关领域研究和开发的专家、学者和工程师提供一个交流合作的平台,北京大学王选计算机研究所拟于2021年12月在北京召开“第十一届全国文字与计算学术研讨会(NSCC 2021)”,受新冠疫情影响,本次研讨会采用线上会议的方式开展。
“全国文字与计算学术研讨会(NSCC)”从2011年至今已经连续举办了十一届,会议受到广大参会代表的好评。本次会议将采用线上学术报告与主题研讨的方式进行学术交流,旨在探讨和揭示文字计算领域中存在的本质问题,展示学术研究的最新进展,推动理论研究成果在工业界的应用和推广。本次会议由北京大学王选计算机研究所和中国文字字体设计与研究中心联合承办。
会议主题:AI赋能文字计算
腾讯会议(会议ID:待发送)
2021年12月19日
会议主席
郭宗明(北京大学王选计算机研究所)
连宙辉(北京大学王选计算机研究所)
会议日程
时间:2021年12月19日(星期日)
地点:腾讯会议 (会议ID:待发送)
08:40 | 欢迎致辞,嘉宾线上合影 主持人:郭宗明(北京大学研究员) 汤帜(北京大学王选计算机研究所所长) |
学术报告 1 主持人:郭宗明 时间:08:40–10:25 | |
08:40- 09:15 | 刘成林 中国科学院自动化研究所研究员 报告题目:基于结构学习的文档分析与识别 |
09:15- 09:50 | 金连文 华南理工大学教授 报告题目:光学文字识别:从数据驱动到知识驱动 |
09:50- 10:25 | 白翔 华中科技大学教授 报告题目:重新思考CRNN和DB-Net |
休息 时间:10:25–10:30 | |
学术报告-2 主持人:连宙辉 时间:10:30–12:00 | |
10:30- 11:05 | 吕岳 华东师范大学教授 报告题目:基于风格迁移的无监督字体生成研究 |
11:05- 11:25 | 丁二锐 百度视觉技术部总监 报告题目:文字识别的外延:结构化与编辑 |
11:25 - 12:00 | 郭宗明 北京大学研究员 报告题目:字效生成技术研究 |
午休 时间:12:00–14:00 | |
学术报告-3 主持人:连宙辉 时间:14:00–15:30 | |
14:00– 14:30 | 王健 中国科学院自动化研究所研究员 报告题目:智慧书法教育及其评测系统 |
14:30– 15:00 | 刘永革 安阳师范学院甲骨文信息处理教育部重点实验室教授 报告题目:甲骨文离人工智能有多远? |
15:00– 15:30 | 张俊松 厦门大学副教授 报告题目:书法审美认知与计算 |
休息 时间:15:30–15:40 | |
学术报告-4 主持人:张俊松 时间:15:40 – 17:00 | |
15:40– 16:10 | 连宙辉 北京大学副教授 报告题目:AI驱动的字体辅助设计与自动生成 |
16:10– 16:40 | 赵博程 西安电子科技大学副教授 报告题目:面向文字风格的交互式学习方法 |
16:40– 17:00 | 陈恳 北京北大方正电子有限公司字库技术开发部部长 报告题目:方正字库在字形计算技术应用方面的新进展 |
时间:17:10–18:00 主题研讨: AI赋能文字计算 主持人:连宙辉 参与人:主题研讨嘉宾 |
学术报告及报告人信息
(按报告顺序)
刘成林
中国科学院自动化研究所研究员
刘成林,中国科学院自动化研究所副所长,模式识别国家重点实验室主任,研究员、博士生导师,中国科学院大学人工智能学院副院长。1989年、1992年、1995年分别在武汉大学、北京工业大学、中国科学院自动化研究所获学士、硕士和博士学位。1996年至2004年先后在韩国科学技术院、日本东京农工大学、日立中央研究所从事博士后和研发工作。2005年起在中国科学院自动化研究所任研究员。2008年获得国家杰出青年科学基金。研究兴趣包括模式识别、机器学习、文字识别与文档分析等。在国内外期刊和学术会议上发表论文300余篇,合著英文专著一本。现任Pattern Recognition期刊和《自动化学报》的副主编,以及多个期刊的编委。任中国人工智能学会副理事长、会士,中国自动化学会会士、模式识别与智能系统专委会主任,中国图象图形学学会常务理事。美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。
报告题目:
基于结构学习的文档分析与识别
报告摘要:
文档图像(包括印刷和手写文档、场景文本图像、联机手写文档等)分析与识别的任务包括版面分析、文本识别、语义信息提取等。近几年,用结构化预测模型(条件随机场、图神经网络等)结合深度学习的方法,在文档版面结构分析方面取得了很大进展。文本识别进展也很大,但识别结果的置信度和字符结构分析仍是需待攻克的难题。本报告介绍本研究组在基于结构化学习的文档分析与识别方面的一些进展,包括基于图神经网络的版面分析、表格分析和手写数学公式识别,基于图匹配的手写字符结构分析等。金连文 华南理工大学教授
金连文,男,于中国科技大学获学士学位、华南理工大学获博士学位,目前为华南理工大学二级教授,兼任中国图像图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任等学术服务职务。主要研究领域为文字识别、深度学习、计算机视觉及应用等,在IEEE Transactions及重要国际国内学术期刊、ICDAR/ICFHR/ CVPR/AAAI/IJCAI/NeurIPS/ECCV等重要国际会议上发表学术论文200余篇,获省部级科技奖5次(含排名第1的广东省科技进步一等奖1次),指导学生参加国际学术竞赛荣获冠军20余次。
报告题目:
光学文字识别:从数据驱动到知识驱动
报告摘要:
光学文字识别(OCR)技术在图像理解、信息录入、智慧金融、办公、身份认证、信息安全等诸多领域有非常广阔的应用前景,是计算机视觉及人工智能领域的重要问题之一。近年来,基于数据驱动的文字识别已经有很多深入的研究工作及成果报道,但如何利用领域知识、结合文本语义知识来更好的进行文字识别和理解文档图像,是OCR领域中的研究新方向及趋势之一。在本报告中,我将简要介绍在领域知识辅助的OCR、基于OCR+NLP的文档结构化理解等方面的一些研究进展,并探讨OCR领域未来发展的一些新方向及新问题。白翔 华中科技大学教授
白翔,华中科技大学人工智能与自动化学院教授、国家防伪工程技术研究中心副主任。主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文60余篇。由于在场景文字检测与识别取得的突出成就,2019年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR Young Investigator Award (青年学者奖)。现任期刊IEEE TPAMI, Pattern Recognition, Frontier of Computer Science, 中国科学-信息科学、自动化学报编委。曾担任CVPR、AAAI、ICPR等人工智能主流国际会议的领域主席/资深技术程序委员或竞赛主席十余次,并获得AAAI-2019 Outstanding SPC Award。中国人工智能学会理事,中国图象图形学学会理事,中国自动化学会模式识别与机器智能专委会副主任,中国计算机学会计算机视觉专委会常务委员,IEEE资深会员。2014-2020连续7年入选Elsevier中国高被引学者榜,2020年入选IAPR Fellow。
报告题目:
重新思考CRNN和DB-Net
报告摘要:
CRNN、DB-Net已被OCR领域广泛采用,本次报告将从全新视角解读两种算法,并且对文字识别未来发展趋势和潜在研究方向进行了预测。吕岳 华东师范大学教授
吕岳,华东师范大学教授,通信与电子工程学院院长。研究领域包括模式识别、图像处理、机器学习、智能系统等,长期致力于信函和包裹分拣的智能化研发,在中国邮政上海研究院先后兼任研发部主任、副总工程师、副院长、首席科学家,负责研制的信函自动分拣机和包裹自动分拣机得到推广应用并出口国外,以第一完成人获得中国邮政科学技术一等奖、上海市科技进步一等奖。主持承担国家自然科学基金、国家重大研发计划、国家科技支撑计划、上海市科委和经信委以及企业委托的项目和课题,发表学术论文150余篇,授权发明专利19项,担任Pattern Recognition等国际期刊编委,中国图象图形学学会文档图像分析与识别专委会副主任、上海市图象图形学学会计算机视觉与模式识别专委会主任。吕岳教授享受国务院政府特殊津贴,入选教育部新世纪优秀人才计划、上海市曙光学者、上海市优秀技术带头人、上海市领军人才、交通运输部优秀科技人员和优秀科技创新团队带头人。
报告题目:
基于风格迁移的无监督字体生成研究
报告摘要:
图像风格迁移技术往往提取图像的笔触、色调、纹理等风格特征的表示,并将其作用于任意的内容图像中,在保留内容的情况下将图片转换为目标风格。不同于自然图像的风格迁移,字体风格迁移需要关注不同字体之间笔画的几何轮廓、位置、粗细等方面的特征。本报告聚焦基于风格迁移的大规模字体生成方法,介绍一种可形变生成对抗模型,该模型结合文字图像特有的风格特点,提取并分离文字图像的内容特征和风格特征,实现字体风格迁移的方法。具体来说,在特征空间估计不同字体间文字对应笔画的偏移量,利用可形变卷积网络实现从参考字体到目标字体的风格迁移,生成具有完整结构的文字图像。该模型能够在无需人工标注数据的条件下,实现大规模、高质量的字体生成,可应用于字库生成、字迹模仿、跨语言文字。丁二锐 百度视觉技术部总监
丁二锐,博士,百度视觉技术部总监,CCF-CV、CSIG青工委等专委会委员。负责百度计算机视觉技术的基础研发和管理工作,领导部门先后获得40余项国际比赛冠军,开放150余项能力,支撑的计算机视觉公有云/质检云先后多次被Forrester/IDC评为市场第一。个人已发表论文40余篇,获得50余项中国专利和10余项美国专利,曾获ICDAR 2019 最佳论文第二名奖,百度“最佳经理人”奖(2018),中国电子学会科技进步一等奖(2018),国家技术发明奖二等奖(2020),担任ICDAR2019/2021,CVPR2020/2021等多个学术研讨会和竞赛的组织者。
报告题目:
文字识别的外延:结构化与编辑
报告摘要:
文字识别在产业智能化进程中不断普及,同时也催生了很多交叉学科的新课题。本报告结合百度文字识别落地实践,提出并分享两个重要的技术探索方向。首先,面向文档智能,着重阐述结构化预训练模型的构造和应用,以期解决视觉富文本文档理解问题。其次,面向平面设计,着重阐述文字编辑、擦除及生成的原理,以期解决素材生成问题。
郭宗明 北京大学研究员
郭宗明,博士、研究员、博士生导师、享受国务院政府特殊津贴专家,1987/90/94于北京大学分别获得学士/硕士/博士学位。目前担任北京大学王选计算机研究所学术委员会主任兼副所长,电子出版新技术国家工程中心主任,教育部中国文字字体设计与研究中心主任,中国图象图形学学会数字文化遗产专委会副主任。主要研究方向为数字视频处理及计算机动画处理、图像视频处理、文字处理。曾获中国高等学校十大科技进展(第二完成人)、国家科技进步二等奖(第一完成人)、教育部科技进步一等奖(第一完成人)和二等奖、教育部技术发明奖二等奖、北京市科学技术一等奖各一次。在教书育人方面获得北京市优秀师德先进个人荣誉,六次获得北京大学优秀博士论文指导教师称号,和中国图象图形学会优博指导教师称号。截至到目前累计发表学术论文200多篇,申请专利100多项。
报告题目:
字效生成技术研究
报告摘要:
文字面向过去是重要的文化遗产保护内容,面向现在是生产生活中最常见的视觉元素之一。文化遗产要保护、传承,也要发展。现有图像风格化针对自然图像和绘画风格展开研究,鲜少讨论文字的风格化。本报告面向文字特效的新风格与文字风格化的新模型这两个科学问题,在图像风格化领域提出了新的字效迁移和生成研究问题,并建立了艺术字生成的统一框架。在数据层面,研究了字效的统计先验,指导不同数据规模下的风格建模问题,构建大规模字效数据库建立了字效迁移的基准,推动领域发展。在模型层面,优化了模型对多风格的支持,探索了字效的扩展、编辑和控制方式。在应用层面,采用统一框架解决了字效迁移、艺术字生成、图文设计和文字提取等问题,降低了人们使用和定制艺术字的门槛。王健 中国科学院自动化研究所研究员
王健,清华大学计算机科学与技术系博士后、美国德克萨斯大学访问学者,现为中国科学院自动化研究所研究员、文化大数据工程中心副主任。主要研究方向为智能计算与控制、文化大数据技术等。曾主持/参与国家/省部级以上项目/课题40余项;公开发表学术论文60余篇;申请发明专利40多项;IEEE Senior member、中国计算机学会高级会员、中国人工智能学会会员、中国自动化学会工作普及专业委员会副主任、中国图象图形学学会数字文化遗产专委会副主任;文化部全国文化信息资源共享工程专家委员会委员等等。
报告题目:
智慧书法教育及其评测系统
报告摘要:
基于人工智能和大数据技术,实现书法教育的高效化、科学化、趣味化,提高学习效率,缓解书法师资的紧张;同时,不占用课余时间,调节青少年学习紧张情绪,对青少年身心健康大有裨益,且符合美育赋能,契合国家“双减”的同时推动“双增”政策的落实。刘永革 安阳师范学院教授
刘永革,教授,计算机与信息工程学院院长,甲骨文信息处理教育部重点实验室主任,郑州大学硕士生导师,河南省计算机学会理事、河南省教育厅学术技术带头人。主要研究方向甲骨文信息处理,主持了2项国家自然科学基金面上项目,主持2项国家社科基金重大项目子课题,主持1项教育部、国家语委甲骨文研究与应用专项,带领甲骨文信息处理团队采用人工智能技术开创甲骨文研究的新路线,正在打造世界最大的甲骨文大数据平台“殷契文渊”。
报告题目:
甲骨文离人工智能有多远?
报告摘要:
近年随着国家对甲骨文研究的重视,以及人工智能技术的发展,不断有研究者发表论文探讨利用人工智能技术研究甲骨文的识别、释读等问题。本报告以甲骨文大数据平台“殷契文渊”建设为例,谈一谈遇到的问题和思考。
人工智能目前能解决哪些问题?人工智能解决甲骨文问题的前提是什么?
殷契文渊复杂性的挑战。
我们的研究进展和希望解决的问题。
张俊松 厦门大学副教授
张俊松,博士毕业于浙江大学计算机辅助设计与图形学国家重点实验室,曾在美国南加州大学(USC)、加州理工学院(Caltech)等校访问学习,现为厦门大学信息学院人工智能系副教授,厦门大学脑认知与智能计算实验室主任,北京大学中国文字字体设计与研究中心专家委员,中国计算机学会计算艺术分会执行委员,期刊Brain Informatics的Associate Editor,计算神经美学国际研讨会International Workshop on Computational Neuroaesthetics的 Workshop Chair等。主要研究领域为人工智能与艺术、脑认知科学等的交叉研究,在国内外期刊和会议,如Nature Communications,IEEE Transactions on Visualization and Computer Graphics,ACM Transactions on Applied Perception,Computer Graphics Forum,Brain,Neuroscience和中国科学(信息科学)等上面发表论文50余篇,获授权国家发明专利8项。先后主持国家自然科学基金、航空科学基金等。曾获中国大学生智能设计竞赛优秀指导教师奖,中国计算机辅助设计与图形学大会最佳论文奖,全国数字娱乐与艺术研讨会最佳论文奖等。
报告题目:
书法审美认知与计算
报告摘要:
书法欣赏与创作是人类复杂的思维和实践活动,我们从审美认知与计算两个角度对其进行了一些探索性的研究。首先,围绕欣赏书法时的大脑活动机制,引入认知科学研究方法,探索在欣赏书法时的脑活动机制;其次,书法创作的计算模拟由于涉及人类创造性思维、语义理解等,一直是人工智能领域的挑战性问题,报告也将介绍我们在书法创作的计算模拟方面的探索性工作。连宙辉 北京大学副教授
连宙辉,北京大学王选计算机研究所副教授,中国文字字体设计与研究中心副主任。研究领域为计算机图形学与人工智能,近十年主要从事面向文字的形状建模与图像合成技术研究。主持完成国家自然科学基金面上、国家语委重点等科研项目,在领域重要期刊(TOG, IJCV等)与会议(SIGGRAPH/SIGGRAPH Asia, CVPR, NeurIPS等)上发表论文70余篇,谷歌学术引用1900余次,授权国家发明专利近20项。担任CCF-A国际会议ICCV-21领域主席,获中国专利优秀奖(排名1)、中国人工智能学会吴文俊人工智能优秀青年奖、北京市科技新星计划等奖励/资助。中文字体制作生成方面的部分成果已通过技术转让在企业投入使用,相关软件/产品广泛应用于各大主流移动平台上。
报告题目:
AI驱动的字体辅助设计与自动生成
报告摘要:
文字是人类文明得以留存传承、人类社会得以进步发展的核心要素。进入信息化时代以来,文字如何在计算机中进行使用和传播成为人们必须解决的第一要务,尤其是随着图形界面的出现,字体相关技术(字体渲染、分析、制作等)逐渐成为计算机图形学领域中的一个经典且重要的研究方向。随着计算机软硬件技术的发展尤其是互联网和移动智能设备的普及,人们对具备特定风格和个性化形态字体的需求愈加强烈,传统的劳动密集型的字体设计制作工艺已经成为制约字体产业发展和字库消费市场扩张的主要瓶颈。近年来,随着人工智能技术尤其是基于深度学习的生成对抗网络、变分自编码器等图形图像生成模型的提出、应用与快速发展,字体设计、制作和生成技术也取得了长足进步,逐渐从数字化阶段迈入智能化时代。
本报告将概述近年来字体辅助设计与自动生成技术的研究进展,并重点介绍我们团队本年度发表的三个最新工作(基于深度强化学习的中文字体合成[AAAI-21],基于元学习的潦草汉字书写轨迹生成[Eurographics-21],基于双模态学习的高质量矢量字体自动生成[TOG/SIGGRAPH Asia-21])。
赵博程 西安电子科技大学副教授
赵博程,博士、西安电子科技大学华山准聘副教授,2011年、2014年在西北工业大学获得学士、硕士学位。2020年在中国科学院自动化研究所获得博士学位。目前主要从事人机交互、序列建模与风格学习、机器智能化等方面的研究。先后参与多项中科院先导项目、科技部重点研发计划、科技委重大项目、国家重点研发计划重点专项、陕西省自然科学基础研究计划一般项目、中国博士后基金面上资助等科研项目10余项。近年来在Pattern Recognition、AAAI、ICASSP、ICPR、ROBIO等知名国际期刊/会议发表多篇论文。
报告题目:
面向文字风格的交互式学习方法
报告摘要:
在机器学习领域中,如何通过人机交互的方式使得算法在数据集不增加的情况下学习更多的知识是一个长期热点。以‘教会算法写字’为例,传统基于深度学习的方法是序列-序列的生成方法,或图像生成方法。这些方法在数据库有限的情况下难以生成风格多变的文字符号。基于交互学习的风格生成算法可以通过少量人机交互的形式从已有的风格信息中挖掘文字手写体序列或图像包含的隐藏知识,从而提升算法的输出表现。同样的,交互式学习为代表的小样本数据内容挖掘方法也可被扩展至其他领域。
陈恳
北京北大方正电子有限公司字库技术开发部部长
陈恳,中国文字字体设计与研究中心字库应用技术研究室副主任,北京北大方正电子有限公司字库技术开发部部长,方正集团技术专家。
报告题目:
方正字库在字形计算技术应用方面的新进展
报告摘要:
基于传统字形计算技术应用的多年积累,借助AI赋能,方正字库近年在字稿辅助处理、字体风格识别、可变字库技术以及面向互联网的字体管理工具与个人做字练字工具等方面取得了一定的进展,现向学界简要汇报。
联系方式
若须帮助,请联系下列会务工作人员:
刘亦天 15230399625
王逸之 13120338379
夏泽青 15650703612
报名链接
本次会议不录播,仅限报名人员参会,请在2021年12月16日前报名(免费注册,参会人员数量上限300人),腾讯会议ID等信息将通过邮件发送。
← 扫码报名
← 扫码入群
北大王选所
2021年度优秀成果推介
近期发布
release
— 版权声明 —
本微信公众号刊载的所有内容,由北京大学王选计算机研究所微信自身创作、收集的文字、图片和音视频资料,版权属北京大学王选计算机研究所所有;从公开渠道收集、整理及授权转载的文字、图片及音视频资料,版权属原作者。